- INFORMATIQUE ET SCIENCES HUMAINES
- INFORMATIQUE ET SCIENCES HUMAINESS I L’IMPORTANCE des bouleversements que l’informatique provoque dans des domaines toujours plus nombreux de la vie sociale est désormais perçue, l’attention accordée aux modifications qu’elle introduit dans la connaissance de l’homme et de la société – les sciences humaines – est restée longtemps cantonnée à un cercle restreint de chercheurs. Le mouvement est pourtant amorcé dès les années soixante. Non seulement il touche la quasi-totalité des disciplines, dont il tend à modifier l’infrastructure instrumentale et économique, mais il se répercute également sur le plan des méthodes, voire sur celui des conceptions théoriques. Pour les sciences de l’homme, en effet, l’informatique est fondamentalement la concrétisation de la pensée formelle.Informatique et sciences humaines: un moment de la rechercheL’importance croissante du rôle que l’informatique joue dans le développement des sciences de l’homme tient en premier lieu à des raisons fonctionnelles. L’aptitude des dispositifs informatiques à saisir et à traiter largement l’information se trouve être en effet à la croisée d’une double exigence: en premier lieu, celle du projet scientifique lui-même de mieux appréhender son objet – et la perspective de l’accumulation d’une quantité presque illimitée d’information peut, à coup sûr, donner l’illusion de répondre à cette préoccupation; en second lieu, celle qui est liée aux nouvelles conditions du travail dans les sciences humaines à partir de la fin des années cinquante, caractérisées à la fois, au moins pour certaines disciplines (économie, géographie, sociologie, droit), par une demande émanant de l’administration et des entreprises, et, sur le plan de l’organisation de la recherche , par l’émergence et le développement rapide de formations puissantes, rassemblant des dizaines de chercheurs dotés de moyens sans commune mesure avec ceux dont pouvait disposer le savant traditionnel. Une organisation proche, en somme, de celle dont les sciences de la nature se sont progressivement dotées depuis un siècle.Dans ce cadre, le projet collectif devient la règle – comme on peut le constater même dans ces disciplines apparemment vouées à l’érudition individuelle que sont l’archéologie et la linguistique –, ce qui va dans le sens de l’accumulation et de la mise à disposition commune de l’information. De plus, l’existence de la demande évoquée plus haut incite certainement le chercheur à doubler le discours habituel d’une représentation de ses objets qui offre – ou semble offrir – des garanties de préhension effective. Ainsi sont nées la plupart des bases de données .Enfin, le rôle joué par l’informatique dans une modification aussi profonde des conditions de travail est inséparable de facteurs idéologiques (par exemple, telle conception de la modernité) ou de certains traits psychosociologiques qui marquent profondément le monde de la recherche: prestige, compétition intellectuelle, contrôle de l’information comme facteur de pouvoir.Mais si le recours à l’informatique n’est pas complètement intelligible hors d’un certain contexte, une explication qui se réduirait à cette pression fonctionnelle externe serait elle-même tout à fait insuffisante. Il est facile de vérifier que les recherches les plus richement dotées par les organismes interministériels dans des domaines aussi «sensibles» que les comportements sociaux, l’aménagement de l’espace, les dispositifs de formation et de communication... ont souvent donné lieu à des discours parfaitement traditionnels quant à leur forme et à leur élaboration méthodologique, alors que des disciplines moins engagées dans le siècle – et moins soutenues financièrement, comme l’histoire, l’archéologie, l’histoire de l’art, la linguistique, les études littéraires... – ont parfois témoigné d’une remarquable assimilation des techniques de l’informatique et de leur substrat méthodologique formel.On commence, en effet, à percevoir que l’enjeu essentiel est de nature proprement scientifique et qu’il est lié à la notion de formalisation, notion avec laquelle les humanités n’entretiennent pas nécessairement des relations moins affines que les sciences sociales. L’importance du rôle de l’informatique dans le développement des sciences de l’homme tient d’abord à ce qu’elle associe à sa dimension instrumentale un cadre théorico-méthodologique qui suggère des exigences formelles capables de changer, à terme, la nature et la portée des connaissances dans un certain nombre de disciplines.Informatique et démarche formelle dans les sciences de l’hommeL’informatique est entendue ici non seulement comme un outil d’une puissance sans précédent pour le «traitement de l’information», mais aussi comme un ensemble de constructions formelles (langages, codes, algorithmes, etc.) qui sont la réalisation de méthodes d’analyse et de représentation des phénomènes, depuis le niveau de l’observation empirique jusqu’à celui de l’élaboration de théories formelles. Ces méthodes sont de nature sémiologique et linguistique aussi bien que mathématique et logique. Et l’on notera que pour les sciences humaines, où le problème de la description réglée des phénomènes et des documents reste sans solution générale satisfaisante (à la différence des sciences de la nature), les méthodes sémiologiques et linguistiques associées à l’informatique sont certainement complémentaires des méthodes mathématiques.La nature de l’intervention informatique peut, en effet, être rapportée à un axe qui est celui du niveau d’abstraction des représentations que l’on traite, ordonnées selon une certaine «distance» aux phénomènes représentés. Ainsi, on opposera deux pôles de référence: le premier sera celui de la description, comme paraphrase réglée de l’observation, comme transcription codée du savoir disponible (la constitution des données), où l’incarnation informatique, dans l’acception extensive que nous lui donnons ici, prendra la forme de langages de représentation, de «codes», etc.; le second, celui de la structuration des données, en vue de «modéliser» les phénomènes, en entendant par là la mise en évidence d’éventuelles régularités qui ordonnent les phénomènes (ou plutôt leur description) et plus largement la recherche d’articulations logiques nouvelles qui permettent d’appréhender avec plus de «puissance» explicative des classes plus étendues de phénomènes. Dans ce cas, les instruments seront généralement de nature mathématique.Les constructions formelles obtenues par ces moyens peuvent avoir des statuts logiques différents (configurations heuristiques, propositions conjecturales, «théorèmes», etc.) qui posent de ce fait divers types de problèmes d’interprétation (le retour des formes au sens) et de validation (la mise à l’épreuve empirique). C’est par ce biais – la définition de la logique sous-jacente et le rapport du théorique à l’empirique – que le recours à l’informatique induit concrètement dans la recherche en sciences humaines la confrontation entre des conceptions différentes de la science: d’une part, celles qui procèdent de la tradition empirico-logique des sciences expérimentales et des sciences formelles et qui sous-tendent par conséquent l’informatique; d’autre part, celles qui s’inscrivent dans les traditions herméneutique et dialectique, conceptions qui fondent une large part des sciences humaines, surtout en Europe.Cette confrontation épistémologique constitue le cadre de référence par rapport auquel devrait s’éclairer le sens de l’évolution en cours; néanmoins, les sciences de l’homme ont jusqu’ici surtout recouru à l’informatique à des fins utilitaires, essentiellement pour stocker et gérer de l’information au sens de bases de données, de systèmes documentaires, etc. Ce recours a pu s’effectuer éventuellement à l’aide de logiciels informatiques sophistiqués (extraction automatique du contenu informatif des textes, reconnaissance des formes sensibles, systèmes de questions-réponses en temps réel, etc.), pilotant dans certains cas des instruments technologiquement évolués (dispositifs d’acquisition et de restitution de l’information écrite, graphique, voire vocale, mémoires satellites rapides, etc.). S’il ne faut pas confondre, comme il arrive parfois, complexité technologique des moyens et statut théorique des résultats, il ne saurait être question non plus de sous-estimer ces aspects fonctionnels. La «grille» (fig. 4) devrait permettre de mieux discerner les différents plans sur lesquels s’établit le rapport de l’informatique aux sciences humaines.Une grille d’analyseLa constitution des donnéesDans cette phase, le but est de décrire les phénomènes qui font l’objet de l’étude, c’est-à-dire de leur associer des représentations réglées à l’aide de systèmes de symboles, numériques ou non. À la représentation des phénomènes peut s’adjoindre celle du savoir contextuel les concernant, qu’il s’agisse d’un savoir empirique ou déjà partiellement théorisé. Ce sont ces représentations, convenablement élaborées du point de vue formel, qui constituent les données soumises aux différents traitements informatiques. Encore faut-il remarquer que la notion classique de «quantification» est tout à fait insuffisante dans le cas des sciences humaines et que des systèmes de représentation capables d’exprimer la complexité des situations à décrire doivent certainement être conçus dans la perspective plus large des langages formels. On peut distinguer les situations descriptives selon divers points de vue.Tout d’abord, selon la nature des sources qui servent de base à la constitution des données: textes, images, comportements, artefacts, configurations spatiales... Chacune pose des problèmes spécifiques de nature linguistique et sémiologique comme premier stade de la formalisation. Ce n’est que lorsque ces problèmes ont été correctement résolus que peuvent être constituées les données, au sens opérationnel du terme. Les applications informatiques en sciences humaines sont encore le plus souvent centrées sur le «calcul» (de nature statistique et mathématique), alors que peu d’attention est portée sur la nature exacte des données sur lesquelles on opère. Pourtant, certaines questions sont inévitables: quels sont les rapports entre les «documents» et leur représentation? quels aspects ont été retenus ou omis? en vertu de quels critères? quelle est la «stabilité» (la régularité) des représentations à l’intérieur d’un même corpus et quelles conventions adopter pour qu’elles soient indépendantes de l’analyste (objectivité)? quelle information contextuelle a éventuellement été mobilisée pour «interpréter» tel ou tel trait du phénomène? On voit bien que hors de ces contraintes les calculs sur les représentations sont des calculs sur des êtres mal définis, par conséquent des calculs sans grande signification.Il est intéressant de remarquer que l’impulsion venue de l’informatique a contribué à développer une importante sémiologie «non littéraire» – applicable en particulier à la description réglée des documents non textuels: artefacts, images, configurations spatiales, etc. – en même temps que des approches nouvelles pour l’analyse des textes.Ensuite, on peut distinguer les situations descriptives selon le niveau d’élaboration de la mise en forme des descriptions. D’une part, sur le plan des langages et systèmes de représentation dans l’acception informatique de ces termes, et là les sciences humaines ont été stimulantes pour l’informatique, ne serait-ce que par la nouveauté et la complexité des problèmes posés: ainsi des langages comme Snobol ou Sycil, des systèmes de représentation et de traitement des données comme Satin. D’autre part, sur le plan de l’instrumentation: soit sous l’angle des logiciels , pour des structures de fichiers, voire des systèmes d’exploitation particuliers; soit du point de vue matériel , pour des dispositifs spécifiques (de traitement de la voix, par exemple).Un autre critère intervient aussi, celui de la finalité qui préside à la constitution des données, par exemple:a ) en vue de certains calculs, justifiés par des conjectures théoriques , et supposant une mise en forme et une structure logique particulière des données, rejoignant ainsi des préoccupations du type «représentation des connaissances» dans la perspective de l’intelligence artificielle ;b) en vue d’explorer une situation heuristique – affaiblissement des conditions examinées ci-dessus (a ) sans pour autant avoir une perspective aussi «universelle» que ci-après (c );c) en vue de constituer un archivage sans avoir nécessairement un projet complètement défini d’exploitation ultérieure. C’est le cas de la plupart des projets de constitution de bases de données en sciences sociales dès qu’elles dépassent la taille d’un travail individuel, et c’est aussi l’un des problèmes potentiellement les plus graves des sciences sociales dans la mesure où ces données sont la représentation accessible du monde empirique, sur laquelle s’appuiera donc toute construction théorique ultérieure. En outre, les moyens nécessaires à la constitution de ces archives sont considérables. De ce fait, le choix de ce type d’investissement se répercute sur l’entière économie de la recherche. En outre, il ne fait aucun doute que la disposition de ces données est porteuse de «pouvoir» social, politique et économique, voire idéologique et culturel.La situation la plus fréquente, de très loin, parce qu’elle est celle des opérations administratives, publiques et privées, est celle de la poursuite d’objectifs fonctionnels précis de «gestion du social». Il s’agit évidemment d’un cas tout à fait différent de ceux que pose la recherche scientifique, mais c’est par ce biais que les stocks de données les plus importants sur la société et l’individu sont constitués. L’impact politique, économique, social et culturel de ce phénomène promet d’être – est déjà – de première grandeur.Enfin, la constitution des données peut également s’analyser selon des modalités plus proprement informatiques: qu’il s’agisse d’applications de méthodes ou d’outils informatiques déjà éprouvés, cas évidemment le plus courant, ou de recherches nouvelles lorsque les outils existants ne sont pas satisfaisants (fonctionnellement ou théoriquement). Il en est ainsi pour les «réseaux sémantiques», les «scénarios» et, plus largement, pour l’ensemble des recherches poursuivies sous le terme de «représentation des connaissances». Ces recherches se répercutent à différents niveaux, que ce soit par la définition de nouveaux formalismes ou de nouvelles méthodes d’analyse et de traitement, pouvant aller jusqu’à inspirer la conception d’architectures spécialisées en exploitant, par exemple, les possibilités ouvertes par les microprocesseurs. Ces recherches, qui ont renouvelé l’«intelligence artificielle», sont nées en particulier de l’analyse du raisonnement non déductif. Elles puisent largement dans les méthodes et les résultats de la linguistique, en particulier la sémantique, et de la psychologie cognitive.Il faut cependant souligner que la représentation des connaissances telle qu’elle est entendue ici ne renvoie pas à une simple paraphrase de la perception immédiate du monde empirique. Elle est conçue pour l’expression formelle d’une connaissance structurelle et, au moins en projet, comme un instrument logique permettant par des inférences définies sur l’univers de référence de construire des modèles de certaines classes de phénomènes.La structuration des donnéesOn envisage ici les critères qui correspondent à un emploi de l’informatique destiné à passer de la description des phénomènes (sans «gain» de connaissance) à la mise en évidence des «structures» qui les sous-tendent éventuellement: régularités, lois, modèles formels, dans le cadre d’une démarche respectant les contraintes constitutives du savoir scientifique, contraintes sur lesquelles se développe l’important débat épistémologique évoqué plus haut.Les instruments de cette «réorganisation» des données sont le plus souvent de nature mathématique, et il peut être commode, pour les appréhender, de les distinguer:– Selon leur nature formelle (statistique, algébrique, topologique, logique, etc.) en sachant que l’importance actuelle du rôle de la statistique est d’abord le reflet de l’absence presque générale de cadres théoriques dont procéderaient des structures de représentation plus complexes, mais aussi plus spécifiques aux classes de phénomènes étudiés.– Selon la fonction logique qu’ils remplissent dans l’élaboration des résultats: explorations heuristiques, vérifications d’hypothèses empiriques, déductions internes à une théorie existante, etc.– Selon le niveau d’élaboration instrumentale auquel ils sont envisagés sur un axe: formalisationlogiciel expérimentalproduit-programme. L’adéquation fonctionnelle et l’économie sont alors les critères principaux. L’évolution très rapide de la technologie se reflète d’ailleurs dans la manière de concevoir le rôle de l’instrumentation informatique. Ainsi l’introduction croissante des procédures interactives par le développement de la micro-informatique et du télétraitement modifie-t-elle certaines options méthodologiques en laissant au savant la possibilité de faire intervenir directement son savoir – ou ses hypothèses – à différents moments du calcul.– Enfin, selon le degré d’innovation scientifique que ces formalismes et ces programmes apportent soit dans le domaine des sciences humaines, soit en informatique. Dans cette dernière perspective, l’informatique est partiellement redevable aux sciences humaines en ce qui concerne par exemple l’«analyse des données», la communication homme-machine, la linguistique formelle, les logiques modales. Même une problématique aussi liée à l’ingénierie que la conception assistée par ordinateur (C.A.O.) se trouve enrichie par les expériences menées dans le domaine de la création musicale, des arts plastiques et de l’architecture.Il n’est pas douteux que l’informatique devra accentuer l’attention qu’elle commence à porter à certaines disciplines des sciences humaines et multiplier les emprunts, soit pour acquérir des connaissances (ainsi en phonétique pour l’analyse et la synthèse de la parole), soit pour s’inspirer de certaines méthodes (méthodes de psychologie cognitive pour les processus d’apprentissage).Interdépendance des opérations descriptives et structurellesLes critères définis ci-dessus (constitution des données et structuration de celles-ci), s’ils ont d’abord pour fonction de distinguer les principaux types d’emploi de l’informatique, constituent aussi une sorte d’inventaire des problèmes de toute nature qui se posent – ou se poseront – aux sciences humaines comme à l’informatique. Mais cet inventaire ne serait pas complet si nous ne signalions pas ceux qui proviennent de l’interdépendance des phases descriptives et structurelles. En effet, si l’on admet que dans de nombreux domaines les limites des connaissances théoriques ne permettent pas d’aller au-delà d’une description des phénomènes sur d’autres bases qu’intuitives, ou que les objectifs de la constitution des données sont purement fonctionnels (par exemple, documentaires en vue d’un archivage), les opérations descriptives ne peuvent alors qu’être traitées isolément.En revanche, il est peu concevable que l’on tente de structurer des phénomènes, c’est-à-dire de les modéliser, sans avoir au moins fait des hypothèses sur l’adéquation des représentations (données) sur lesquelles portera le calcul, adéquation envisagée sous différents aspects, d’ailleurs solidaires: qu’ils soient formels – contraintes liées aux méthodes mathématiques et informatiques (conditions de validité, calculabilité) –, logiques – comptabilité des présupposés descriptifs et calculatoires, cohérence du raisonnement, etc. –, ou techniques – par exemple, adéquation des moyens d’exploitation.Cette liste, qui n’est pas limitative, suffit à donner une idée de l’ampleur et de la complexité des problèmes à résoudre. Si un certain nombre d’entre eux (les plus difficiles) ne sont pas souvent posés de manière explicite, nul doute pourtant qu’ils n’apparaissent dès que les sciences humaines auront commencé à dégager les implications les plus profondes de leurs recours aux méthodes formelles. Mais il est vraisemblable que l’informatique elle-même subira les effets de cette rencontre. Pour des raisons scientifiques, et plus encore du fait de facteurs socio-économiques essentiels, elle se trouve déjà associée à des problèmes issus des sciences humaines, même s’il s’agit moins de connaissance que de gestion et de contrôle. Qu’en retirera-t-elle comme enrichissement de la complexité de ses méthodes, voire de ses logiques? Qu’en retireront les sciences de l’homme sur le plan de l’affermissement théorique du savoir? Les réponses à ces questions se dessinent sous nos yeux.
Encyclopédie Universelle. 2012.